查看原文
其他

重新思考BK中介模型, 关于中介效应分析的神话与事实!

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

photo courtesy: bing
关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!

正文

关于下方文字内容,作者:李松泽,中央财经大学中国经济与管理研究院,通信邮箱:964916858@qq.com
作者之前的文章:1.谁嫁(娶)给了谁?基于CHIP的DID方法发现, 与岳父母的教育有关!2.男神毛咕噜最新Top5大作, 另外, 有序因变量依然使用OLS回归! 3.应用计量经济学现状: 因果推断与政策评估最全综述 4.万字长文述"家庭经济学"进展, 诺奖得主贝克尔长耕于此!5.实证应用经济学中的稳健性检验是什么? 怎么做?哪些策略呢?
Zhao, Xinshu, et al. “Reconsidering Baron and Kenny: Myths and Truths about Mediation Analysis.” Journal of Consumer Research, vol. 37, no. 2, 2010, pp. 197–206. JSTOR, www.jstor.org/stable/10.1086/651257. Accessed 16 Aug. 2020.
Baron and Kenny’s procedure for determining if an independent variable affects a dependent variable through some mediator is so well known that it is used by authors and requested by reviewers almost reflexively. Many research projects have been terminated early in a research program or later in the review process because the data did not conform to Baron and Kenny’s criteria, impeding theoretical development. While the technical literature has disputed some of Baron and Kenny’s tests, this literature has not diffused to practicing researchers. We present a nontechnical summary of the flaws in the Baron and Kenny logic, some of which have not been previously noted. We provide a decision tree and a step-by-step procedure for testing mediation, classifying its type, and interpreting the implications of findings for theory building and future research.
参看:整理了34篇关于中介, 调节和机制分析的文章! 揭开事务间的机理就靠它了!
Baron and Kenny(1986)提出的中介效应(mediation)分析框架在社会心理和消费者行为等诸多社会科学研究中产生了十分深远的影响。截至2009年,已有上万篇期刊论文引用了该文章,但是该“标准”框架(后文简称BK框架)背后潜在的陷阱却很少被应用研究者所关注。今天介绍的这篇文章(Zhao et al., 2010)为Journal of Consumer Research的编辑约稿,旨在修正BK框架的缺陷,并提出了新的中介效应分析框架,以期提高研究和发表的质量。
1. BK框架下的中介效应分析
考虑一个简单的三变量非递归因果模型(nonrecursive causal model):自变量X通过中介变量(mediating variable)M来影响因变量Y。如下图所示

BK框架认为要使变量M起到“中介作用”,需满足三个条件:自变量X的变动应能够显著解释待定中介变量M的变动(路径a显著);中介变量M的变动能够显著解释因变量Y的变动(路径b显著);控制路径a和b后,X与Y之间原本显著的关联将消失(路径c不显著)。为此BK框架要求估计如下3个方程:

对应于上述的判定条件,系数a、c’和b的显著性决定了中介效应是否存在。同时BK框架还要求进一步对间接路径做Sobel z检验,其统计量由下式给出:

其中sa和sb分别是a和b系数估计的标准误。
BK框架认为,识别中介效应最强的证据是间接效应()显著而直接效应(c)不显著,称该情况为“完全中介效应(full mediation)”。如果间接和直接效应均显著,则称为“部分中介效应(partial mediation)”。
2. BK框架存在的问题
Zhao et al.(2010)主要指出了BK框架存在的三点问题:第一,直接效应的缺失不应成为评价中介效应强度的标准;第二,寻找中介效应无需以X对Y存在显著的净效应(c’)为前提;第三,Sobel z检验的效力并不强,存在改进方式。
2.1 直接效应的价值
尽管完全中介效应被BK框架视为最优情形,但多数研究却只能识别出部分中介效应,即直接效应c在控制了中介变量后仍然显著。Zhao et al.(2010)认为这并不是一个令人失望的事实,因为显著直接效应的符号能够为理论构建提供直观的启示。
在特定情况下,研究者能够根据先验的理论预期显著直接效应的存在。例如在研究避孕工具的使用对性传播疾病的影响时,研究者可以提出如下的理论路径:避孕工具的使用(X)通过降低个体对拥有多个性伴侣的感知风险(M),间接地提高了性病感染率(Y)。但是X对Y的直接效应也是一目了然的:避孕工具的使用通过物理防护,直接地降低了性病感染率。
但是在更多的情况下,研究者很可能对潜在的直接效应有先验预期。此时,显著的直接效应意味着某些中介变量被模型忽略了,而发掘这些中介变量将成为未来研究的主题。一个典型的例子是对关系营销研究(relationship marketing)的进展。Morgan and Hunt(1994)的经典研究发现,关系营销通过增加信任与承诺来提升商业效益。但是Palmatier et al.(2006)的meta分析则指出,在关系营销对商业效益的总效应(total effect)中,仅有三分之一是间接由信任和承诺的提升造成的。那么如何解释剩余的正向直接效应呢?Palmatier et al.(2009)的研究进一步发现了另一个关键的中介变量:消费者感恩(consumer gratitude)。
2.2 “多余”的前提
在BK框架下,进行中介效应分析的前提是自变量X对于因变量Y存在显著的“零阶效应”,即方程(2)中的系数c’(X和Y的相关系数rXY)需要是显著的。这样的X-Y检验被一些文献称为“待调节效应(effect to be mediated)”。
从直觉上看,如果待调节效应本身并不显著,似乎就没有寻找中介变量的必要了。但是这样的想法是错误的,因为BK框架忽略了一个基本事实:X-Y的相关系数rXY在数学上是与图1中X对Y的总效应等价的,

也就是说,X对Y的“总效应”相当于间接效应与直接效应c之和。若与c均显著且符号相同,则称这种情况为“互补调节(complementary mediation)”;若二者均显著但符号相反,则称为“竞争调节(competitive mediation)”。
竞争调节可能会造成两种特殊的结果。若直接效应和间接效应的绝对值相近,那么净效应c’便接近于0,从而很可能导致X-Y检验被拒绝。另一方面,若直接效应的绝对值远大于间接效应,那么间接效应的符号便会与待调节效应的符号相反。在BK框架下,这两种特殊情况都会导出不合意的结果。
BK分析框架能够成功识别互补调节,但由于其“多余”的前提,导致潜在的竞争调节往往被忽略。一些有价值的课题可能因为BK框架的缺陷而没能得到更好的发表。本文作者曾利用“超级碗”数据研究同品牌广告播放频率对该品牌消费者评价的影响。这项研究原本有望于顶刊发表,但由于其中介效应分析未通过BK框架的X-Y检验而遭到拒稿。最终,该研究的其他结果发表在了另一份相对普通的刊物上(Zhao,1997)。
2.3 Sobel z检验的改进
BK框架建议研究者采用Sobel z 检验来考察间接效应的显著性,这实际上是在检验总效应和直接效应之间是否存在统计上显著的差异。该方法虽然在研究中被普遍应用,但却存在一定的缺陷,使其检验效力被削弱。由于间接效应是参数a与b的乘积,它的抽样分布以及Sobel z 统计量的分布都不是正态的。若为正,则其抽样分布是正偏态的,但Sobel z 检验的95%置信区间是在均值估计量处对称地取得的。这样构造的置信区间会更频繁地把0包含在内。
Preacher and Hayes(2004, 2008)提出了效力更高的bootstrap检验法,并用SAS和SPSS来实现。该方法通过有放回的抽样生成若干个新样本并估计,最后以它们的均值作为间接效应的估计量。Bootstrap检验利用估计量的经验分布来生成95%置信区间,严格以分布的2.5%分位点和97.5%分位点作为区间端点,有效克服了Sobel z 检验的缺陷。
本文利用Zhao(1997)的数据演示了Preacher-Hayes bootstrap检验的SPSS实现,具体步骤及结果参见原文。
3. 中介效应分析的新框架
本文认为BK框架对于中介效应类型的一维划分方式(即完全中介效应、部分中介效应和无中介效应)是比较粗糙的。作为替代,作者们提出了一种更细致的二维划分方式。以三变量非递归因果模型为例,中介效应被重新划分为五类,其中前三种为存在中介效应(mediation)的情况,后两种为不存在中介效应(nonmediation)的情况:
类型间接效应直接效应两效应符号
complementary mediation相同
competitive mediation不同
indirect-only mediation×
direct-only nonmediation×
no-effect nonmediation××
下表总结了两种划分方式的对应关系:
Baron and Kenny(1986)Zhao et al.(2010)
full mediationindirect-only mediation
partial mediationcomplementary mediation
competitive mediation(significant total effect)
no mediationcompetitive mediation(insignificant total effect)
direct-only nonmediation
no-effect nonmediation
新划分方式与BK框架的关键区别之处在于前者同时考虑了间接路径以及直接路径,所以被作者称为是“二维”的。
为了更清晰地展示新框架下中介效应的识别方式,作者绘制了如下的决策树。该图的上半部分刻画了中介效应的识别路径和类别划分,下半部分则描述了相应的理论含义。

可以看到,在新框架下判别中介效应类型的关键是第一步对间接路径显著性的检验。同时,正如上图2b部分所示,显著的直接效应意味着存在被忽略的中介变量,而其符号则为进一步的探究方向提供了指引。此外,所有类型中最不理想的情况是最右侧的“无效应”路径,这表示实证研究的理论框架是错误的——值得注意的是这种情况在X对Y有显著的总效应时也可能发生。
与BK框架相比,新的判定流程中没有对系数b做单独的检验,因为它本身的显著性并不重要。但如果b的不显著是由X和M的共线性造成的,的显著性也会受到较大影响。所以作者建议在检验时采取效力更高的bootstrap方法,而不是Sobel z检验。
以上决策树所需的参数估计和统计检验都可以利用前文提到的Preacher-Hayes的SPSS代码实现,此处不再赘述。在报告中介效应分析的结果时,作者建议包含如下内容:
l 的均值以及95%置信区间(采用bootstrap法)
l 未标准化的回归系数a, b, c(需要对这些估计结果进行解读)
4. 一些补充说明
4.1 符号的陷阱
作者指出,中介效应分析中存在容易被忽略的“符号陷阱”。若研究者作出了间接效应为正的理论假设,并且发现X和M、M和Y、X和Y之间的相关系数都大于零,那么这是否就可以放心地认为间接效应确实为正了呢?答案是否定的。在这种情况下,可以证明当X、Y和M两两间的相关系数满足:时,方程(3)中的b必然小于0,即间接效应为负,与理论假设相反。落入符号陷阱的研究者应该实事求是地报告他识别出的中介效应类型以及实际的a, b, c估计系数,避免发表错误的结论。
4.2 结构方程模型与BK框架
本文作者认同结构方程模型(SEM)要优于BK框架下的逐步回归,但考虑到前者较高的技术难度以及后者在研究中的广泛应用,本文仍选择通过对BK框架的修正来向广大研究者阐明中介效应的正确分析思路,其核心思想实际上也适用于SEM框架。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存